19/07/2013

Cloudera, punta de lanza de Big Data

Una de las compañías que mejor está aprovechando el buen momento de Big Data es Cloudera. Doug Cutting, ingeniero jefe de la compañía e inventor de la plataforma Hadoop, definió así para este blog la situación actual: “cuando las reglas de cómo funciona algo cambian sus fundamentos, decimos que es una gran transición; es lo que está ocurriendo con Big Data. Hemos visto antes otras en el software, como el paso del mainframe a la informática personal, del procesamiento local a la web; la movilidad ha sido otra gran transición. Lo que lo que estamos viviendo es una transición sobre cómo la información es procesada por las organizaciones”, afirmó Cutting.

Mike Olson

Mike Olson

El negocio de Cloudera gira en torno a Hadoop, por lo que sus ingresos provienen de la venta de servicios y soporte asociados a su distribución de la plataforma de código abierto, gratuita para clusters de un máximo de 50 máquinas. Muchos clientes obtienen la solución gratuitamente, pero en la compañía afirman que basta que un 2% de todos los usuarios de un servicio de código abierto estén dispuestos a pagar para que haya negocio. No en vano algunas de las principales instituciones financieras y de las agencias de gobierno más importantes son clientes de Cloudera.

Ni qué decir tiene, que no está sola. Hace falta más de una compañía para crear un mercado, y para dar forma al de Big Data han surgido varias que compiten con Cloudera; Hortonworks y MapR, las más destacadas, se sirven también de Hadoop para atraer a sus clientes. Las tres se reparten acuerdos y alianzas con grandes compañías de almacenamiento, que han tomado nota del cambio de reglas al que aludía Cutting. Dell y NetApp han firmado acuerdos de colaboración con Cloudera, lo mismo que Oracle, que se apoya en Hadoop para complementar sus bases de datos y, llegado el caso, podría mirar con buenos ojos una posible adquisición. Si no fuera porque IBM ha interferido firmando un acuerdo similar que, en la práctica, bloquea la eventual intención del prójimo.

Por si fuera poco, HP también integra la distribución de Cloudera en un appliance propio. Por su parte, Amazon ha asociado la de MapR a la filial AWS para ofrecerlo como servicio gestionado. Microsoft ya ha anunciado asociarse con Hortonworks, implementado su versión de Hadoop en Windows, allanando su camino en Big Data. Entretanto, EMC va por libre, a través de Pivotal, en la que ha integrado Greenplum, para lanzar su versión de Hadoop combinada con su base de datos de análisis SQL.

Bajo el aparente espíritu de cooperación, las grandes compañías tienden a proteger su negocio. Las bases de datos relacionales son soluciones vigentes, con muchas herramientas creadas a su alrededor y se tardará años en completar las nuevas basadas en Hadoop para que estén a la altura. Se trata de un mercado que exige paciencia, pese a lo que da a entender el ruido que rodea la promoción de soluciones analíticas. “Ahora estamos diciendo: guarda la información y luego piensa en cuáles son los problemas. Porque puedes hacerlo: podría haber múltiples problemas que no conoces”, sentencia Cutting en referencia a la necesidad de seguir contando con las bases de datos relacionales, que exigen conocer el problema que se quiere resolver antes de cargar la información.

En torno a Big Data están naciendo aplicaciones y se está profundizando en su desarrollo a partir de diferentes aproximaciones. En la sede de Cloudera en Palo Alto, se declaran convencidos de que al final se impondrá una sola tecnología y, por supuesto, confían en Hadoop, pero hay otras plataformas, como Spark, que cuenta con el apoyo de Yahoo. La iniciativa es interesante, porque fue en el seno de Yahoo donde el ascético Doud Cutting empezó su proyecto junto con el actual CTO de Cloudera, Amr Awadallah. “Creo que Hadoop se ha posicionado como la plataforma principal en esta nueva forma de hacer las cosas. La carrera ha terminado y [Hadoop] se ha convertido en el estándar para Big Data”, concluye Cutting. Las previsiones de Gartner apuntan en la misma dirección, si bien no son tan tajantes: el 65% de las aplicaciones con funciones analíticas avanzadas funcionarán sobre Hadoop en 2015, según la consultora.

Precisamente, uno de los fundadores de Cloudera, Christophe Bisciglia, ha creado otra empresa, Wibidata, orientada a crear aplicaciones sobre Hadoop. Aunque aún es pronto, Bisciglia se ha puesto manos a la obra porque ve un lucrativo mercado en la venta de soluciones equivalentes a un ERP o CRM para la plataforma de Big Data. No hay que descartar que la propia Cloudera se meta en ese terreno o se acerque a Wibidata, cuyo fundador sigue ligado a su antigua empresa.

Quizá sea este ambiente favorable lo que movido a Intel a entrar en el juego con su propia distribución. Para Cutting, es otra prueba de que va por el buen camino, si bien no deja de ser un competidor, aunque de distinta naturaleza. Porque el gigante de los semiconductores obtiene ingresos de la venta de software, pero su negocio principal es el hardware. Intel ha optimizado su distribución para las memorias de estado sólido, un mercado floreciente que quiere aprovechar para colocar sus propios productos SSD. Su segunda motivación sería frenar la amenaza de ARM, cuyos chips se encuentran en algunos clusters Hadoop, e impulsar sus procesadores Xeon, adaptados para Big Data.

Con toda esta competencia en el mercado, Cloudera está obligada a forzar la máquina para retener su ventaja relativa de pionera. Recientemente ha lanzado Impala, que además de aumentar la rapidez permite hacer consultas SQL a la información asociada a Hadoop. De esta forma, el software de la compañía es capaz de realizar un trabajo que normalmente hace una base de datos relacional. También ha impulsado Cloudera Search, que completa Hadoop ofreciendo más herramientas analíticas, así como escala y fiabilidad en las búsquedas. Todo ello sugiere un posible salto de la analítica al almacenamiento – gracias al rendimiento de los SSD – y a las bases de datos. Lo dice nada menos que Mike Olson, cofundador y hasta hace unas semanas CEO de Cloudera, que ha asumido el puesto de chairman.

Mientras Hadoop evoluciona en el marco de la comunidad open source – Doug Cutting preside actualmente la Apache Foundation – Cloudera también lo hace y tal vez el síntoma más visible de que se avecinan cambios sea precisamente la nueva posición de Olson, sustituido como CEO por Tom Reilly, cuya trayectoria es conocida por haber llevado a otras empresas a adquisiciones y salidas a Bolsa. Fue el CEO de ArcSight el que negoció su venta a HP por 1.500 millones de dólares [siete veces la facturación de la compañía] en 2010.

En la situación actual, ninguna compañía parece estar en una situación de partida ventajosa para una adquisición, ya que los compañeros de viaje se neutralizan entre sí. La singularidad del caso de Cloudera es que parece tentada de dejarse querer, mientras su valoración aumenta y labra el campo para una salida a bolsa. Naturalmente, sin decirlo: en una visita a la sede de la compañía, sus directivos reafirman su vocación de independencia. Aun dando por buenas esas palabras, está claro que quien quiera presentar una oferta tendrá que poner sobre la mesa como mínimo 1.000 millones de dólares (umbral simbólico) y tener el cuajo necesario para aguantar una puja con otros interesados. En cambio, una salida a bolsa ofrecería excelente retorno a los inversores y liquidez a la empresa para comprar otras, como pudieran ser Wibidata u otras desarrolladoras de aplicaciones para Hadoop, procurando así que su marca se convierta prácticamente en sinónimo del nombre de la plataforma. Esta parece ser la estrategia común de Olson y Reilly.

[informe de Pablo G.Bejerano]


Contacto Suscríbete RSS


Sobre el autor. Copyright © 2024 El dominio norbertogallego.com es propiedad y está administrado por Diandro SL. B85905537. Creative Commons